#! /usr/bin/env python
# -*- coding: utf-8 -*-
#对一个ncbi的基因组文件进行id的转化 使他完全匹配gft的结果

# 参数


from Bio import SeqIO
import sys
import argparse



parser = argparse.ArgumentParser(description='''
读取NCBI的基因组 去除分片
cut_ncbi_genome.py -i GCF_000002335.3_Tcas5.2_genomic.fna -o Tca.fa
''')

parser.add_argument('-i',
    help='fasta文件') 

parser.add_argument('-o',
    help='输出的文件') 



args = parser.parse_args()

if not args.i or not args.o:
    parser.print_help()
    sys.exit()


infile = args.i
outfile = args.o


outhandle = open(outfile,'w')

for i in SeqIO.parse(infile,'fasta'):
    i.name = ''
    i.description = ''
    i.id = i.id
    SeqIO.write(i,outhandle,'fasta')


print('写入完成')

























